O método utilizado foi a análise de dados exploratória, o que significa que os dados do estabelecimento Farina in Natura, foram analisados de forma a nos dar informações referente aos acontecimentos passados.
O período analisado foi 01 fevereiro de 2022 a 31 de Outubro 2022
A primeira descoberta na análise foi uma divergência nos dados de vendas de itens e faturamento. Após uma análise dos valores, descobrimos que a falta de entrada dos dados causou essa divergência, isso foi observado na venda de croissants, pois o valor de venda era superior ao valor do item pela sua quantidade. O que isso sugere é a falta da informação referente ao recheio do croissant utilizado, comportamento não ideal, já que deixamos de saber quais são realmente as preferências do cliente no que diz respeito aos recheios.
Foi verificada uma diferença de R$ 31.659,20 entre o valor de venda do item e o preço unitário vezes a quantidade.
Observamos na tabela acima que o valor de venda nesses itens vendidos sempre é maior do que o valor unitário do item multiplicado por sua quantidade
Após essa análise inicial, realizamos a conversão dos dados brutos e a posterior limpeza das informações. Algumas variáveis que foram enviadas pelo cliente foram descartadas, pois apresentavam muita falta de dados. Outras, no entanto, foram omitidas por não estarem no escopo da análise.
O número de diferentes itens vendido pela loja é: 212
A média de itens por venda é: 2.79 itens
O número médio de itens vendidos por período do dia é: Período Média 0 manhã 3.05 2 tarde 2.78 1 noite 2.66
Observamos no gráfico dois pontos que chamam atenção, como destacados no próprio gráfico. Por isso iremos realizar uma análise mais minuciosa.
Para termos uma noção de como o gráfico das vendas se apresentam, excluindo-se esses pontos destacados, segue o gráfico abaixo:
Observamos um pico nas vendas no período entre as 16 e 17 horas, o que nos leva a crer que foram lançadas vendas de diversos períodos no sistema, não apenas as vendas que pertencem ao período. Essa prática leva a distorções na análise das vendas, pois não podemos realmente mensurar de quanto foram as vendas de tais itens em seu tempo de realização, temos então que excluir as vendas de tal período para prosseguirmos nossa análise.
O menor número de vendas em um dia de semana foi: 1 O maior número de vendas em um dia de semana foi: 241 O número médio de vendas em um dia de semana é: 75.81
O menor número de vendas em um dia de fim-de-semana foi: 65 O maior número de vendas em um dia fim-de-semana foi: 227 O número médio de vendas em um dia fim-de-semana é: 133.74
O número médio de itens vendidos por tipo de dia da semana é: Tipo de dia Média 1 FDS 2.84 0 DDS 2.65
| horario | item_count | |
|---|---|---|
| 103 | 2022-05-18 | 241 |
| 99 | 2022-05-14 | 227 |
| 187 | 2022-08-28 | 226 |
| 106 | 2022-05-21 | 226 |
| 242 | 2022-10-23 | 224 |
| 100 | 2022-05-15 | 215 |
| 207 | 2022-09-17 | 197 |
| 200 | 2022-09-10 | 190 |
| 11 | 2022-02-13 | 186 |
| 180 | 2022-08-21 | 183 |
| 29 | 2022-03-05 | 176 |
| 107 | 2022-05-22 | 175 |
| 235 | 2022-10-16 | 172 |
| 173 | 2022-08-14 | 172 |
| 113 | 2022-05-28 | 169 |
| 98 | 2022-05-13 | 169 |
| 43 | 2022-03-19 | 164 |
| 193 | 2022-09-03 | 164 |
| 227 | 2022-10-08 | 161 |
| 194 | 2022-09-04 | 160 |
| 159 | 2022-07-31 | 157 |
| 17 | 2022-02-20 | 156 |
| 114 | 2022-05-29 | 154 |
| 179 | 2022-08-20 | 153 |
| 213 | 2022-09-24 | 151 |
| 172 | 2022-08-13 | 151 |
| 197 | 2022-09-07 | 151 |
| 121 | 2022-06-05 | 150 |
| 186 | 2022-08-27 | 149 |
| 230 | 2022-10-11 | 148 |
| 228 | 2022-10-09 | 146 |
| 37 | 2022-03-13 | 145 |
| 105 | 2022-05-20 | 141 |
| 112 | 2022-05-27 | 141 |
| 44 | 2022-03-20 | 140 |
| 165 | 2022-08-06 | 138 |
| 109 | 2022-05-24 | 136 |
| 111 | 2022-05-26 | 136 |
| 36 | 2022-03-12 | 135 |
| 247 | 2022-10-28 | 135 |
| 171 | 2022-08-12 | 134 |
| 220 | 2022-10-01 | 133 |
| 153 | 2022-07-09 | 133 |
| 208 | 2022-09-18 | 130 |
| 231 | 2022-10-12 | 130 |
| 164 | 2022-08-05 | 129 |
| 234 | 2022-10-15 | 128 |
| 30 | 2022-03-06 | 126 |
| 78 | 2022-04-23 | 126 |
| 214 | 2022-09-25 | 126 |
| 93 | 2022-05-08 | 123 |
| 128 | 2022-06-12 | 123 |
| 51 | 2022-03-27 | 121 |
| 140 | 2022-06-25 | 121 |
| 5 | 2022-02-06 | 121 |
| 101 | 2022-05-16 | 119 |
| 152 | 2022-07-08 | 118 |
| 221 | 2022-10-02 | 117 |
| 201 | 2022-09-11 | 117 |
| 241 | 2022-10-22 | 116 |
| 97 | 2022-05-12 | 116 |
| 76 | 2022-04-21 | 114 |
| 135 | 2022-06-19 | 114 |
| 41 | 2022-03-17 | 114 |
| 160 | 2022-08-01 | 113 |
| 202 | 2022-09-12 | 112 |
| 150 | 2022-07-06 | 112 |
| 4 | 2022-02-05 | 112 |
| 248 | 2022-10-29 | 112 |
| 55 | 2022-03-31 | 111 |
| 178 | 2022-08-19 | 111 |
| 196 | 2022-09-06 | 111 |
| 3 | 2022-02-04 | 110 |
| 166 | 2022-08-07 | 110 |
| 86 | 2022-05-01 | 110 |
| 154 | 2022-07-10 | 109 |
| 10 | 2022-02-12 | 108 |
| 104 | 2022-05-19 | 108 |
| 16 | 2022-02-19 | 107 |
| 102 | 2022-05-17 | 106 |
| 15 | 2022-02-18 | 106 |
| 21 | 2022-02-25 | 106 |
| 92 | 2022-05-07 | 105 |
| 69 | 2022-04-14 | 104 |
| 212 | 2022-09-23 | 103 |
| 149 | 2022-07-05 | 102 |
| 68 | 2022-04-13 | 102 |
| 50 | 2022-03-26 | 102 |
| 184 | 2022-08-25 | 101 |
| 219 | 2022-09-30 | 101 |
| 7 | 2022-02-09 | 101 |
| 215 | 2022-09-26 | 99 |
| 190 | 2022-08-31 | 98 |
| 72 | 2022-04-17 | 97 |
| 243 | 2022-10-24 | 97 |
| 108 | 2022-05-23 | 97 |
| 147 | 2022-07-03 | 97 |
| 96 | 2022-05-11 | 96 |
| 22 | 2022-02-26 | 96 |
| 40 | 2022-03-16 | 95 |
| 141 | 2022-06-26 | 95 |
| 249 | 2022-10-30 | 94 |
| 13 | 2022-02-16 | 93 |
| 192 | 2022-09-02 | 93 |
| 58 | 2022-04-03 | 93 |
| 223 | 2022-10-04 | 92 |
| 26 | 2022-03-02 | 92 |
| 95 | 2022-05-10 | 91 |
| 167 | 2022-08-08 | 91 |
| 24 | 2022-02-28 | 91 |
| 175 | 2022-08-16 | 90 |
| 244 | 2022-10-25 | 89 |
| 189 | 2022-08-30 | 89 |
| 63 | 2022-04-08 | 89 |
| 211 | 2022-09-22 | 88 |
| 8 | 2022-02-10 | 88 |
| 79 | 2022-04-24 | 88 |
| 1 | 2022-02-02 | 88 |
| 191 | 2022-09-01 | 87 |
| 9 | 2022-02-11 | 87 |
| 25 | 2022-03-01 | 87 |
| 199 | 2022-09-09 | 87 |
| 23 | 2022-02-27 | 86 |
| 237 | 2022-10-18 | 86 |
| 185 | 2022-08-26 | 85 |
| 233 | 2022-10-14 | 84 |
| 85 | 2022-04-30 | 84 |
| 218 | 2022-09-29 | 84 |
| 120 | 2022-06-04 | 84 |
| 46 | 2022-03-22 | 83 |
| 162 | 2022-08-03 | 83 |
| 161 | 2022-08-02 | 82 |
| 71 | 2022-04-16 | 81 |
| 19 | 2022-02-23 | 81 |
| 127 | 2022-06-11 | 81 |
| 2 | 2022-02-03 | 81 |
| 143 | 2022-06-28 | 81 |
| 236 | 2022-10-17 | 80 |
| 195 | 2022-09-05 | 79 |
| 91 | 2022-05-06 | 79 |
| 62 | 2022-04-07 | 79 |
| 64 | 2022-04-09 | 78 |
| 238 | 2022-10-19 | 78 |
| 12 | 2022-02-14 | 77 |
| 65 | 2022-04-10 | 77 |
| 32 | 2022-03-08 | 77 |
| 239 | 2022-10-20 | 76 |
| 216 | 2022-09-27 | 76 |
| 204 | 2022-09-14 | 76 |
| 18 | 2022-02-21 | 75 |
| 240 | 2022-10-21 | 75 |
| 163 | 2022-08-04 | 75 |
| 0 | 2022-02-01 | 74 |
| 77 | 2022-04-22 | 74 |
| 170 | 2022-08-11 | 74 |
| 27 | 2022-03-03 | 73 |
| 203 | 2022-09-13 | 73 |
| 94 | 2022-05-09 | 73 |
| 34 | 2022-03-10 | 73 |
| 45 | 2022-03-21 | 72 |
| 132 | 2022-06-16 | 71 |
| 134 | 2022-06-18 | 71 |
| 47 | 2022-03-23 | 70 |
| 181 | 2022-08-22 | 69 |
| 174 | 2022-08-15 | 69 |
| 169 | 2022-08-10 | 69 |
| 229 | 2022-10-10 | 68 |
| 205 | 2022-09-15 | 68 |
| 14 | 2022-02-17 | 68 |
| 168 | 2022-08-09 | 68 |
| 250 | 2022-10-31 | 67 |
| 131 | 2022-06-15 | 67 |
| 48 | 2022-03-24 | 67 |
| 39 | 2022-03-15 | 67 |
| 176 | 2022-08-17 | 66 |
| 245 | 2022-10-26 | 66 |
| 209 | 2022-09-20 | 65 |
| 57 | 2022-04-02 | 65 |
| 56 | 2022-04-01 | 65 |
| 54 | 2022-03-30 | 65 |
| 177 | 2022-08-18 | 65 |
| 155 | 2022-07-11 | 65 |
| 90 | 2022-05-05 | 65 |
| 122 | 2022-06-06 | 64 |
| 210 | 2022-09-21 | 64 |
| 80 | 2022-04-25 | 64 |
| 222 | 2022-10-03 | 64 |
| 144 | 2022-06-29 | 63 |
| 89 | 2022-05-04 | 62 |
| 151 | 2022-07-07 | 62 |
| 232 | 2022-10-13 | 62 |
| 130 | 2022-06-14 | 61 |
| 110 | 2022-05-25 | 61 |
| 224 | 2022-10-05 | 61 |
| 115 | 2022-05-30 | 61 |
| 52 | 2022-03-28 | 61 |
| 148 | 2022-07-04 | 61 |
| 6 | 2022-02-07 | 61 |
| 28 | 2022-03-04 | 60 |
| 20 | 2022-02-24 | 60 |
| 87 | 2022-05-02 | 59 |
| 125 | 2022-06-09 | 58 |
| 198 | 2022-09-08 | 58 |
| 139 | 2022-06-24 | 58 |
| 182 | 2022-08-23 | 57 |
| 82 | 2022-04-27 | 57 |
| 217 | 2022-09-28 | 56 |
| 137 | 2022-06-21 | 56 |
| 60 | 2022-04-05 | 56 |
| 225 | 2022-10-06 | 56 |
| 246 | 2022-10-27 | 55 |
| 81 | 2022-04-26 | 54 |
| 226 | 2022-10-07 | 53 |
| 206 | 2022-09-16 | 53 |
| 183 | 2022-08-24 | 53 |
| 188 | 2022-08-29 | 53 |
| 75 | 2022-04-20 | 52 |
| 116 | 2022-05-31 | 52 |
| 59 | 2022-04-04 | 51 |
| 33 | 2022-03-09 | 51 |
| 119 | 2022-06-03 | 51 |
| 126 | 2022-06-10 | 50 |
| 61 | 2022-04-06 | 49 |
| 129 | 2022-06-13 | 48 |
| 49 | 2022-03-25 | 48 |
| 42 | 2022-03-18 | 48 |
| 145 | 2022-06-30 | 46 |
| 123 | 2022-06-07 | 45 |
| 53 | 2022-03-29 | 43 |
| 84 | 2022-04-29 | 42 |
| 142 | 2022-06-27 | 42 |
| 83 | 2022-04-28 | 41 |
| 117 | 2022-06-01 | 40 |
| 66 | 2022-04-11 | 40 |
| 74 | 2022-04-19 | 40 |
| 38 | 2022-03-14 | 39 |
| 88 | 2022-05-03 | 39 |
| 31 | 2022-03-07 | 38 |
| 73 | 2022-04-18 | 38 |
| 133 | 2022-06-17 | 38 |
| 35 | 2022-03-11 | 37 |
| 124 | 2022-06-08 | 35 |
| 67 | 2022-04-12 | 35 |
| 138 | 2022-06-22 | 32 |
| 136 | 2022-06-20 | 32 |
| 118 | 2022-06-02 | 30 |
| 70 | 2022-04-15 | 19 |
| 156 | 2022-07-12 | 10 |
| 146 | 2022-07-01 | 8 |
| 157 | 2022-07-26 | 2 |
| 158 | 2022-07-29 | 1 |
O gráfico abaixo representa um ranking das vendas por dia.
Utilizando-se um algoritmo podemos inferir que as vendas podem ser dividias em quartis e que o Farina in Natura apresenta a seguinte distribuição:
as 25% finais do Ranking são dias que tem vendas até 62,25 de itens vendidos, os 50% inferiores do ranking tem dias que vendem até 84 itens, sendo esse valor também a mediana, os 75% dos da parte de baixo do ranking vendem até 114 itens, e os 25% do topo dos dias temos vendas de até 190 itens.
Valores acima desses são considerados outliers, ou fora da curva.
A seguir temos um gráfico de distribuição das vendas por hora do dia, que segue a seguinte lógica, 25% das primeiras vendas se dá das 6 às 11 da manhã, os próximos 25% das vendas acontece entre 11 e 16 horas, o terceiro quarto das vendas ocorre entre as 16 e 18 horas, e os últimos 25% das vendas do dia se dá das 18 as 21 horas.
Observamos por esse gráfico que os períodos iniciais e finais do dia são de pouco movimento portanto seria bom rever o horário de abertura e fechamento da loja.
Vemos uma clara diferenciação entre o final de semana e os dias da semana: durante a semana, quase os dobros da venda a noite em relação a manhã e tarde. No sábado vemos um aumento significativo das vendas, principalmente pela manhã, que chega bem perto do período noturno. Já no Domingo há uma inversão completa, o período da manhã é o que apresenta a maior quantidade de vendas, apesar de termos um acréscimo do período da noite em relação aos dias de semana.
Para finalizarmos nossa análise, utilizaremos o algoritmo Apriori.
Queremos aumentar o número de itens vendidos de uma maneira que incentive itens que, caso contrário, não seriam comprados. Devemos levar em conta as variáveis que sabemos que alteram a forma como os clientes interagem conosco (ou seja, hora do dia e dia da semana). O resultado final deve fornecer uma direção clara sobre como agir, por que esse curso de ação é desejável e não deve ser muito confuso para o cliente nem muito complexo para um operador.
A compra de qual item leva à compra de quais outros itens? O algoritmo “Apriori” é capaz de responder isso.
O algoritmo “Apriori” nos ajudará a fazer a combinação de itens a serem vendidos em conjunto. Utilizamos a métrica do SUPORTE para acharmos os itens que são mais vendidos. O SUPORTE é calculado dividindo a quantidade de itens vendidos de um determinado produto pela quantidade de todos os itens vendidos. Por exemplo no caso da Farina In Natura, o item que possui o maior SUPORTE é o croissant(0,2063). O algoritmo fara uma combinação dos itens que tem maior SUPORTE com os de menor SUPORTE. Para isso utilizará as métrica da CONFIANÇA e INCREMENTO.
A CONFIANÇA nos dá a probabilidade de o consequente estar presente em uma transação, dado que o antecedente já está presente. Os valores de confiança variam entre 0 e 1. Um valor de confiança próximo a 1 sugere uma forte relação entre antecedente e consequente, enquanto um valor próximo a 0 indica uma relação fraca.
A métrica INCREMENTO é uma medida usada para avaliar a qualidade das regras de associação geradas pelo algoritmo “Apriori”. Ela ajuda a determinar se a relação entre o antecedente e o consequente em uma regra Antecedente->Consequente é significativa ou se ocorre apenas por acaso. Métricas de INCREMENTO maior que 1, nos dizem que antecedentes e consequentes ocorrem juntos mais frequentemente do que esperaríamos se fossem estatisticamente independentes. Ou seja quanto maior o valor do INCREMENTO maior a dependência deles
Na tabela abaixo vemos combinações de itens propostas pelo algoritmo com base nessas métricas e na ordem de decrescente da métrica Incremento.
| antecedents | consequents | antecedent support | consequent support | support | confidence | lift | leverage | conviction | |
|---|---|---|---|---|---|---|---|---|---|
| 0 | ADICIONAL DE MUSSARELA, ADICIONAL DE PRESUNTO | CROISSANT | 0.006107 | 0.206342 | 0.005637 | 0.923077 | 4.473534 | 0.004377 | 10.317557 |
| 1 | CROISSANT, ADICIONAL DE PRESUNTO | ADICIONAL DE MUSSARELA | 0.006929 | 0.011274 | 0.005637 | 0.813559 | 72.161017 | 0.005559 | 5.303166 |
| 2 | ADICIONAL DE PRESUNTO | ADICIONAL DE MUSSARELA | 0.007634 | 0.011274 | 0.006107 | 0.800000 | 70.958333 | 0.006021 | 4.943629 |
| 3 | CROISSANT, ADICIONAL DE MUSSARELA | ADICIONAL DE PRESUNTO | 0.009395 | 0.007634 | 0.005637 | 0.600000 | 78.600000 | 0.005565 | 2.480916 |
| 4 | CAFE COLMEIA G 200ML | CROISSANT | 0.017851 | 0.206342 | 0.007634 | 0.427632 | 2.072443 | 0.003950 | 1.386621 |
Podemos utilizar as métricas para fazermos as nossas próprias combinações de acordo com o item que queremos aumentar o nível de vendas. Por exemplo, um utem que tenha ainda um suporte baixo mas que tenha uma margem de lucro maior.
Com base nessas descobertas e sugestões, os gestores do estabelecimento Farina in Natura podem tomar decisões informadas e eficientes para melhorar suas operações, aumentar as vendas e a satisfação dos clientes.